sklearn中数据集与xlsx文件的互转

您所在的位置:网站首页 python bunch制作可导入数据 sklearn中数据集与xlsx文件的互转

sklearn中数据集与xlsx文件的互转

2023-09-09 18:16| 来源: 网络整理| 查看: 265

没用过pandas库的直接用sklearn库想必会一脸懵逼:训练的数据明明保存在xlsx文件当中,该如何变成sklearn可用的数据集呢?于是针对y在最后一列的情况,写了下面两个通用模板……

(以玩具数据集iris为例,实际运用中只需修改lst1和lst2,兼容方便)

将数据集转存为xlsx文件:

import pandas as pd import numpy as np from sklearn import datasets iris = datasets.load_iris() lst1, lst2 = iris.data, iris.target#lst1是训练集中的x,lst2是训练集中的y xi = ['x'+str(i+1) for i in range(len(lst1[0]))] df = pd.DataFrame(lst1, columns=xi) df['y'] = lst2 df.to_excel("try2.xlsx", index=False)

将xlsx文件读取成需要的数据集:

df = pd.read_excel('try2.xlsx') # 行列互换 df2 = df.stack() df3 = df2.unstack(0) # lst = df3.values.tolist() # 转列表 lst1, lst2 = lst[:-1], lst[-1] data, target = lst1, lst2 print(data) print(target)


【本文地址】


今日新闻


推荐新闻


    CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3